"고객 별 구매 이력 데이터베이스를 분석하여 고객에 대한 이해를 돕고 이를 바탕으로 각종 마케팅 전략을 통해 보다 높은 이익을 창출할 수 있는 솔루션"
가. 사전처리 → 사후처리 나. 대면조사 → 표본조사 다. 질보다 → 양적으로 라. 상관관계 → 인과관계
"최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?와 같은 최적화 메커니즘을 찾아가는 방법이다"
가. 데이터 이해에서 데이터 준비 단계로 갈 수 있다. 나. 모델링 단계에서 학습용/테스트용 데이터를 사용해 과소 적합을 확인한다. 다. 비즈니스 이해, 데이터 이해 간 피드백이 가능하다. 라. 평가에서 적합하면 바로 프로젝트 투입이 가능하다.
A : B 키 : 175 : 180 몸무게: 70 : 65
클러스터 안의 데이터들이 다른 클러스터와 비교해 얼마나 비슷한가를 나타내는 군집분석 타당성 평가지표로 1에 가까울수록 군집화가 잘 되었다고 판단한다.